# import BeautifulSoup from 'bs4'
from bs4 import BeautifulSoup
# 读取 HTML 文件
with open('index_two.html', 'r', encoding = 'utf-8') as file:
    html_content = file.read()
# print(html_content)
soup = BeautifulSoup(html_content, 'lxml')
# print(soup)
# 标签定位 1 soup.tagName 只会定位到符合条件的第一个标签
tag1 = soup.title
tag2 = soup.span
# 方式2 属性定位，find函数，findall函数
tag3 = soup.find('div',class_ = 'login_div_one') # 定位class 属性值为song的div id 同理 findall函数则是全部满足的所有
# 方式3 选择器定位 soup.select('选择器') id选择器--#xx / class选择器--.xx / 层级选择器 > 表示一个层级 空格表示多个层级
tag4 = soup.select("#stuff")
tag5 = soup.select(".login_div_one")
tag6 = soup.select(".login_div_two div")
tag7 = soup.select(".login_div_two > div > div > span")
# 方式4 提取标签中的内容
# tag.string 只可以提取到直系的文本内容
# tag,text 可以取到标签中所有的文本内容
tag8 = soup.find('span',class_ = 'login_div_one_title').string
tag9 = soup.find('div',class_ = 'login_div_two').text
# 方式5 提取标签的属性值 #tag['attarName']
img_tag = soup.img
print(img_tag) #<img alt="" class="login_div_two_top_div_div_img" src="./assets/image2/images_03.png"/>
print(img_tag['src']) # ./assets/image2/images_03.png

